Wizualizacja źródłowa

źródło: Wikipedia

Brak wymagań dotyczących daty zamieszczenia poprawianego wykresu pozwolił mi pochylić się nad najwybitniejszą wizualizacją w dziejach. Przedmiot moich rozważań stanowi bowiem Opus Magnum Doktora Karla-Heinza Hochhausa. Wydaje mi się, że dość jasne jest czemu wykres ten nie należy do najbardziej udanych, jednakże z kronikarskiego obowiązku wypiszę jego wady.

  1. Jest to wykres 3D.

  2. Zielone banany w tle skutecznie odwracają uwagę czytelnika.

  3. Lata są podwójnie kodowane (pozycja słupka i jego kolor).

  4. Wiele słupków jest zupełnie niewidocznych, nie mówiąc już o tym, że odbiorca często nie jest w stanie podać wysokości nawet tych widocznych.

Poprawiona wizualizacja

Uporządkowanie danych

Dane do wizualizacji pobrałem ze strony FAO. Aby odwzorować poprawnie wizualizacje źródłową musiałem połączyć dane z Belgium, Luxembourg i Belgium-Luxembourg w jedno państwo. Wynikało to z dziwnego sposobu zapisu danych przez FAO na przestrzeni tysiącleci.

B <- read.csv("FAOSTAT.csv")

df <- B[,c("Area", "Year", "Value")]

df <- df %>%
    mutate(Area = ifelse(Area %in% c("Belgium", "Luxembourg", "Belgium-Luxembourg"), "Belgium-Luxembourg", Area)) %>% 
    group_by(Area, Year) %>% 
    summarise(Value = sum(Value)) %>% 
    mutate(Value_Millions = round(Value/10^6, 2))

Wykres interaktywny

plot_ly(df, 
        x = ~Year, 
        y = ~Value_Millions,
        color = ~Area,
        type = "scatter",
        mode = "lines") %>% 
    layout(
            title = "Export of Bananas 1994-2005",
            xaxis = list(title = "Year"),
            yaxis = list(title = "Milions of tons"))

Dlaczego ta wizualizacja lepszą jest?

Wykorzystanie interaktywnych możliwości poltly pozwoliło mi znacznie uprościć wykres jednocześnie nie tracąc żadnych informacji w nim zawartych. Mamy tutaj wykres liniowy, który jest prosty w intepretacji i dobrze pokazuje zmianę ilości eksportowanych bananów na przestrzeni lat. Ponadto dzięki funkcjonalnością takim jak przybliżanie, podświetlanie danej wartości czy wygaszanie niektórych linii możemy bez problemu porównywać ze sobą poszczególne kraje, co nie było możliwe w wizualizacji źródłowej.